热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

双臂|夹角_程序员买啥游戏机,自己动手做一个体感小游戏

篇首语:本文由编程笔记#小编为大家整理,主要介绍了程序员买啥游戏机,自己动手做一个体感小游戏相关的知识,希望对你有一定的参考价值。摘要

篇首语:本文由编程笔记#小编为大家整理,主要介绍了程序员买啥游戏机,自己动手做一个体感小游戏相关的知识,希望对你有一定的参考价值。




摘要:结合一个仿制的简易Flappy Bird游戏,ModelBox体感小游戏就这样诞生了。

本文分享自华为云社区《ModelBox开发案例 - 体感小游戏》,作者:菊厂飞戈。

前段时间,小鱼老师在AI说发布了文章 ModelBox推理真的高效吗,里面介绍了双阶段单人人体关键点检测案例,运行速度超快:使用原生的ONNXRuntime API做开发,可以达到36fps;而ModelBox版本(推理框架同样是ONNXRuntime),更是达到了接近80fps!

于是乎,笔者产生了一个大胆的想法:这么快的人体关键点检测应用,不用来跑游戏可惜了呀!经过一段时间的开发调试,结合一个仿制的简易Flappy Bird游戏,ModelBox体感小游戏诞生了:

玩家通过上下摆动双臂做出“扇动翅膀”的动作,阻止小鸟下落,躲避画面中的“狼柱”;如果小鸟不小心碰到了“狼”或者触碰到画面边缘,游戏停止,然后会重新开始。画面左上方显示的是玩家存活的时长。

本案例使用的是Windows版本的 ModelBox SDK,如果对此还不熟悉,请先阅读 ModelBox端云协同AI开发套件(Windows)开发环境篇,如果对 ModelBox AI应用开发感兴趣,欢迎参加我们的 ModelBox实战营。


工程结构

本案例是在小鱼老师的 single_human_pose 应用基础上修改而来,案例所需资源(代码、模型、测试数据等)均可从obs桶下载。工程目录与原始版本基本一致,下面列出其中不一样的地方:

single_human_pose
├─data
│ ├─game // 体感游戏资源目录
│ ├─icon // 体感游戏所需的图标资源
│ ├─src // 体感游戏源代码,可独立运行
│ └─dance_120fps.mp4 // 测试视频
├─etc
│ └─flowunit // 功能单元目录
│ ├─draw_pose // 关键点绘制功能单元
│ ├─draw_pose.py // 关键点绘制功能单元入口文件
│ ├─draw_pose.toml // 关键点绘制功能单元配置文件
│ ├─draw_utils.py // 其他功能函数存放文件
│ ├─flappy.py // Flappy Bird核心逻辑
│ ├─smooth.py // 平滑算法,使关键点更稳定
│ └─vector.py // 平面坐标系中点的运算
│ ├─... // 其他功能单元
├─graph
│ ├─single_human_pose.toml // 默认的技能流程图
│ └─single_human_pose_camera.toml // 使用摄像头运行的技能流程图
├─...
└─build_project.sh

Flappy Bird

本案例中游戏相关的资源和代码在 data/game 目录下,我们可以直接执行其中 src 下的 main.py 文件,得到一个使用键盘控制的 Flappy Bird 游戏。main.py 文件中的核心函数内容如下:

def run():
# 初始化游戏
snake = Snake() # 贪吃蛇
flappy = Flappy() # Flappy Bird
pacman = Pacman() # 吃豆人
# 初始化摄像头,参数0表示设备的第一个摄像头
cap = cv2.VideoCapture(0)
# 判断摄像头初始化是否成功
if not cap.isOpened():
print('failed to open camera 0')
exit()
# 设置分辨率为 960 x 540
cap.set(3, 960)
cap.set(4, 540)
while True:
# 读取一帧视频图像,ret表示读取是否成功
ret, frame = cap.read()
# 对原始图像做高斯模糊,避免干扰到游戏画面
frame = cv2.GaussianBlur(frame, (0, 0), 5)
# 阻塞等待键盘响应1ms,获取按下的按键值
pressed_key = cv2.waitKey(1) & 0xFF
if pressed_key == ord('q'): # 如果按下q键则退出游戏
break
else: # 根据按键类型更新游戏画面
# frame = snake.update_snake_keyboard(frame, pressed_key)
frame = flappy.update_flappy_keyboard(frame, pressed_key)
# frame = pacman.update_pacman_keyboard(frame, pressed_key)
# 打开一个名为game的窗口,显示图像
cv2.imshow('game', frame)
# 释放摄像头资源
cap.release()
# 关闭所有窗口
cv2.destroyAllWindows()

可以看到,其中包含了3个小游戏:贪吃蛇、吃豆人和Flappy Bird。游戏界面使用OpenCV绘制,程序将打开0号摄像头,将游戏画面叠加在摄像头画面上;在每帧的绘制中,程序阻塞1ms等待键盘响应,根据按键不同控制游戏的运行:按下空格键将控制小鸟往上飞行一段距离(具体内容查看 src/flappy.py )。开发者可以解开另外两个游戏的注释代码,试试它们的游戏效果。


关键点绘制功能单元

Flappy Bird游戏与人体关键点检测应用的结合,完全容纳在 draw_pose 功能单元中。在原始的 single_human_pose 应用里,这个功能单元只是将检测到的关键点数据绘制到画面中;本应用中,在得到人体关键点数据后,又计算了双臂与身体的夹角,如果检测到“扇动翅膀”的动作,则控制小鸟往上飞行一段距离。游戏画面与高斯模糊后的人体关键点画面叠加在一起显示,既能看到AI应用的效果,也不至于干扰到游戏画面的显示。

def open(self, config):
...
# 使用图标资源初始化Flappy Bird游戏控制示例
icon_path = config.get_string("icon_path", ".")
self.flappy = Flappy(icon_path)
return modelbox.Status.StatusCode.STATUS_SUCCESS
def process(self, data_context):
...
for image, hand_pose in zip(in_image, in_feat):
...
# 获取上一功能单元输出的人体关键点数据
pose_data = np.array(hand_pose.as_object(), copy=False)
pose_data = pose_data.reshape((self.kps, 3))
# 计算双臂与身体的夹角
arm_angles = get_arm_angles(bbox, pose_data, self.keypoints_smooth)
...
# 在摄像头画面中画出主要的人体关节,并作高斯模糊
draw_pose(out_img, bbox, pose_data, self.score_thre)
out_img = cv2.GaussianBlur(out_img, (0, 0), 5)
# 根据双臂动作控制游戏画面更新,叠加到摄像头画面中做展示
out_img, alive = self.flappy.update_flappy_pose(out_img, arm_angles, fps)
...
return modelbox.Status.StatusCode.STATUS_SUCCESS

camera流程图

游戏的运行需要实时的摄像头画面,因此本案例增加了使用PC自带或者外接的USB摄像头作为输入源的流程图,对应文件为 single_human_pose_camera.toml,其中的流程图描述 graphconf 内容如下:

graphconf = """digraph single_human_pose
node [shape=Mrecord]
queue_size = 1
batch_size = 1
input1[type=input,flowunit=input,device=cpu,deviceid=0]
data_source_parser[type=flowunit, flowunit=data_source_parser, device=cpu, deviceid=0]
local_camera[type=flowunit, flowunit=local_camera, device=cpu, deviceid=0, pix_fmt=bgr, cam_width=960, cam_height=540]
det_pre[type=flowunit, flowunit=det_pre, device=cpu, deviceid=0]
color_transpose[type=flowunit flowunit=packed_planar_transpose device=cpu deviceid=0]
normalize[type=flowunit flowunit=normalize device=cpu deviceid=0 standard_deviation_inverse="0.003921568627451, 0.003921568627451, 0.003921568627451"]
det_human[type=flowunit, flowunit=det_human, device=cpu, deviceid=0, batch_size=1]
det_post[type=flowunit, flowunit=det_post, device=cpu, deviceid=0]
object_tracker[type=flowunit, flowunit=object_tracker, device=cpu, deviceid=0]
expand_box[type=flowunit, flowunit=expand_box, device=cpu, deviceid=0]
image_resize[type=flowunit flowunit=resize device=cpu deviceid="0" image_width=192, image_height=256]
color_transpose2[type=flowunit flowunit=packed_planar_transpose device=cpu deviceid=0]
mean[type=flowunit flowunit=mean device=cpu deviceid="0" mean="116.28,103.53,123.68"]
normalize2[type=flowunit flowunit=normalize device=cpu deviceid="0" standard_deviation_inverse="0.0175070,0.01742919,0.01712475"]
det_pose[type=flowunit, flowunit=det_pose, device=cpu, deviceid=0, batch_size=1]
pose_post[type=flowunit, flowunit=pose_post, device=cpu, deviceid=0]
draw_pose[type=flowunit, flowunit=draw_pose, device=cpu, deviceid=0]
video_out[type=flowunit, flowunit=video_out, device=cpu, deviceid=0]
input1 -> data_source_parser:in_data
data_source_parser:out_video_url -> local_camera:in_camera_packet
local_camera:out_camera_frame -> det_pre:in_image
det_pre:resized_image -> color_transpose:in_image
color_transpose:out_image -> normalize:in_data
normalize:out_data -> det_human:input
det_human:output1 -> det_post:in_feat1
det_human:output2 -> det_post:in_feat2
det_human:output3 -> det_post:in_feat3
det_pre:out_image -> det_post:in_image
det_post:has_human -> object_tracker:in_image
object_tracker:out_image -> expand_box:in_image
expand_box:out_image -> image_resize:in_image
image_resize:out_image -> color_transpose2:in_image
color_transpose2:out_image -> mean:in_data
mean:out_data -> normalize2:in_data
normalize2:out_data -> det_pose:image
det_pose:heatmap -> pose_post:in_feat
pose_post:out_data -> draw_pose:in_feat
object_tracker:out_image -> draw_pose:in_image
draw_pose:out_image -> video_out:in_video_frame
det_post:no_human -> video_out:in_video_frame
"""

与 single_human_pose.toml 相比,这个流程图使用 local_camera 替换了 video_demuxer 和 video_decoder 功能单元,其他部分是一致的。

打开工程目录下bin/mock_task.toml文件,修改其中的任务输入和任务输出配置为如下内容:

[input]
type = "url"
url = "0" # 表示0号摄像头,即PC自带摄像头,若PC无摄像头需外接USB摄像头
[output]
type = "local"
url = "0:pose_game" # 表示名为```pose_game```的本地窗口

即使用编号为0的摄像头(默认为PC自带的摄像头),输出画面显示到名为pose_game的本地屏幕窗口中。

执行bin/main.bat camera运行应用,就可以开始游戏了:


点击关注,第一时间了解华为云新鲜技术~


推荐阅读
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法,并提供了多个实际代码示例,帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目,具有很高的参考价值。 ... [详细]
  • 本文详细解析了Python中的os和sys模块,介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]
  • SQLite 动态创建多个表的需求在网络上有不少讨论,但很少有详细的解决方案。本文将介绍如何在 Qt 环境中使用 QString 类轻松实现 SQLite 表的动态创建,并提供详细的步骤和示例代码。 ... [详细]
  • 在维护公司项目时,发现按下手机的某个物理按键后会激活相应的服务,并在屏幕上模拟点击特定坐标点。本文详细介绍了如何使用ADB Shell Input命令来模拟各种输入事件,包括滑动、按键和点击等。 ... [详细]
  • 本文详细探讨了JDBC(Java数据库连接)的内部机制,重点分析其作为服务提供者接口(SPI)框架的应用。通过类图和代码示例,展示了JDBC如何注册驱动程序、建立数据库连接以及执行SQL查询的过程。 ... [详细]
  • 在 Flutter 开发过程中,开发者经常会遇到 Widget 构造函数中的可选参数 Key。对于初学者来说,理解 Key 的作用和使用场景可能是一个挑战。本文将详细探讨 Key 的概念及其应用场景,并通过实例帮助你更好地掌握这一重要工具。 ... [详细]
  • 本文详细介绍了Java中org.neo4j.helpers.collection.Iterators.single()方法的功能、使用场景及代码示例,帮助开发者更好地理解和应用该方法。 ... [详细]
  • Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]
  • 使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表
    本文介绍了一段通用代码示例,该代码不仅能够操作 Azure Active Directory (AAD),还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级:AAD 和 Subscription。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • 微软Exchange服务器遭遇2022年版“千年虫”漏洞
    微软Exchange服务器在新年伊始遭遇了一个类似于‘千年虫’的日期处理漏洞,导致邮件传输受阻。该问题主要影响配置了FIP-FS恶意软件引擎的Exchange 2016和2019版本。 ... [详细]
  • 本文介绍了多个关于JavaScript的书籍资源、实用工具和编程实例,涵盖从入门到进阶的各个阶段,帮助读者全面提升JavaScript编程能力。 ... [详细]
author-avatar
哀乐交加6
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有